Théorie de la coalescence
Théorie de la coalescence
Modèle rétrospectif de
Génétique des populations dont l'objectif est de suivre l'évolution de tous les
Allèles d'un
Gène donné de tous les individus d'une
Population, jusqu'à une seule copie ancestrale.
Pasted image 20250421202354.png|100- on appelle cette copie ancestrale l'ancêtre commun le plus récent
- les relations d'hérédité entre les Allèles sont représentés par un arbre \(\mathcal T_n(t)\) similaire à un Arbre phylogénétique, appelé coalescent
- mathématiquement, un coalescent est représenté par un Processus de Markov \((\Pi(s),s\geqslant0)\) à valeurs dans l'ensemble des Partitions \(\mathscr R_t\) de \([\![1,n]\!]\)
- un bloc de \(\Pi(s)\) représente une lignée à l'instant \(t-s\), et il contient l'ensemble de ses lignées descendantes à l'instant \(t\)
- pour cette modélisation, \(i\) et \(j\) sont dans le même bloc de \(\Pi(s)\) si et seulement si les \(i\)-ème et \(j\)-ème individus de la population à l'instant \(t\) ont le même ancêtre au temps \(t-s\)
- les transitions sont données par : \(q_{\xi \eta}=\) \(\Bbb 1_{\xi\prec\eta}\) et \(q_\xi=\) \(\frac12\lvert\xi\rvert(\lvert\xi\rvert-1)\)
- \({\Bbb P}(\mathscr R_{k-1}=\eta\mid\mathscr R_k=\xi)=\) \(\Bbb 1_{\xi\prec\eta}\frac2{k(k-1)}\)
- la probabilité d'être dans l'état \(\xi\) lorsqu'il ne reste que \(k\) lignées est donnée par : $${\Bbb P}(\mathscr R_k=\xi)=\binom nk^{-1}\frac{(k-1)!}{(n-1)!}\lvert\xi_1\rvert!\,\lvert\xi_2\rvert!\,\dots\lvert\xi_k\rvert!$$avec \(\xi_1,\dots,\xi_k\) les sous-ensembles de \(\xi\)
- la Nombre de lignées dans un coalescent \((D_t,t\geqslant0)\) est donc également un Processus markovien de sauts : c'est un Processus de mort pur de taux \(q_{kl}=\frac12k(k-1)\Bbb 1_{l=k-1}\)
- on appelle également coalescence le phénomène de fusion de deux lignées
- cette théorie est principalement attribuée à John Kingman
START
Ω Basique (+inversé optionnel)
Recto: Comment est définit un \(n\)-coalescent dans le papier original de Kingman (1980) ?
Verso: C'est un
Processus markovien de sauts \(\{R_t,t\geqslant0\}\) sur l'ensemble \(\mathcal E_n\) des
Relation d'équivalences sur \([\![1,n]\!]\), dont le
Générateur infinitésimal est donné par : $$q_{\xi \eta}=\begin{cases}1&\text{si}\quad\xi\prec \eta\\ 0&\text{sinon.}&\end{cases}$$où \(\xi\prec \eta\iff\xi\supset\eta,\lvert\xi\rvert=\lvert\eta\rvert+1\).
(
Processus de naissance et de mort sans naissances)
Bonus:
Carte inversée ?:
END
START
Ω Basique (+inversé optionnel)
Recto: Expliquer pourquoi l'étude de \((L_n(t),t\geqslant0)\) (correspondant à la somme des longueurs des branches dans l'arbre) est intéressante.
Verso: Si on suppose que les
Mutations arrivent avec un taux constant \(\theta\), alors \(L_n(t)\) est \(\approx\)proportionnel au nombre de
Mutations distinctes observées dans la population à l'instant \(t\).
Bonus:
Carte inversée ?:
END